|
Diese Arbeit beschäftigt sich mit der Anwendung von datenbasierten
Methoden in der Sprachsynthese. Im Gegensatz zu regelbasierten
Verfahren, die Theorien aus der Linguisik bzw. Phonetik
implementieren, werden die Modelle bei datenbasierten Methoden, wie
der Name schon sagt, auf natürlichsprachlichen Daten tainiert. Zu
diesem Zweck müssen die Daten entsprechend aufbereitet und für die
maschinelle Verarbeitung zur Verfügung gestellt werden.
Im ersten Teil dieser Arbeit wird auf die Prinzipien der
Datenerfassung, Datenaufbereitung und Datenhaltung sowie der
Konsistenzprüfung eingegangen. Es wird gezeigt, wie man zu einem
Sprachkorpus kommt, das als Grundlage für die Erstellung
datenbasierter Modelle benötigt wird. Insbesondere wird auch auf
die unterschiedlichen Dateiformate sowie deren Möglichkeiten und
Grenzen eingegangen.
Der zweite Teil beschäftigt sich mit dem Erstellen datenbasierter
Modelle. Und zwar werden ein Lautdauermodell zur Bestimmung der
Lautdauer auf Segmentebene sowie ein selektionsbasiertes
Syntheseverfahren, welches eine größere Sprachdatenbank verwendet,
um daraus ein Sprachsignal zu erzeugen, trainiert.
|